p1 p2 p3 p4 … pm u1 4 2 1 … u2 3 5 … 1 u3 1 4 3 … 5 … … … … … un 2 4 5 … 3
Vi ma trân đanh gia R th̀ ̣ ́ ́ ường rât l n va th a th t, nên viêc d đoan giá ớ ̀ ư ớ ̣ ự ́ ́ tri cua cac phân t ̣ ̉ ́ ̀ ử rij = găp nhiêu kho khăn. Đ gi i quy t v n đ này,̣ ̀ ́ ể ả ế ấ ề phương pháp th a s hóa ma tr n đừ ố ậ ược xem là m t trong nh ng phộ ữ ương pháp
h u hi u nh t hi n nay. Nó đữ ệ ấ ệ ượ ử ục s d ng ph bi n trong các h khuy n nghổ ế ệ ế ị b i có hi u su t cao c v ch t lở ệ ấ ả ề ấ ượng khuy n ngh và kh năng m r ng.ế ị ả ở ộ
Phương phap th a sô hoa ma trâń ừ ́ ́ ̣
Phương pháp th a s hóa ma tr n là m t trong nh ng thành công nh từ ố ậ ộ ữ ấ c a mô hình nhân t n. Nó cho phép k t h p các thông tin đã có v i thông tinủ ố ẩ ế ợ ớ b sung. Khi thông tin ph n h i rõ ràng không có s n, h th ng t v n có thổ ả ồ ẵ ệ ố ư ấ ể suy ra s thích c a ngở ủ ười dùng b ng cách s d ng thông tin ph n h i ng mằ ử ụ ả ồ ầ ho c gián ti p ph n ánh ý ki n b ng cách quan sát hành vi ngặ ế ả ế ằ ười dùng.
Phương phap th a sô hoa ma trân anh xa nǵ ừ ́ ́ ̣ ́ ̣ ươi dung va san phâm vaò ̀ ̀ ̉ ̉ ̀ môt không gian f chiêu Ṛ ̀ f, s tự ương tac gi a nǵ ữ ười dung va san phâm đ̀ ̀ ̉ ̉ ược mô hinh hoa trong không gian nay. Khi đo, môi san phâm ̀ ́ ̀ ́ ̃ ̉ ̉ i được liên kêt v í ớ môt vector san phâm ̣ ̉ ̉ f
i
q R , môi ng̃ ươi dung u đ̀ ̀ ược liên kêt v i môt vectoŕ ớ ̣ ngươi dung ̀ ̀ f
u
p R . Đôi v i môi san phâm ́ ớ ̃ ̉ ̉ i, cac yêu tô ́ ́ ́qi đo m c đô tich c cứ ̣ ́ ự hay tiêu c c cua san phâm đo. Đôi v i môi ngự ̉ ̉ ̉ ́ ́ ớ ̃ ươi dung ̀ ̀ u nhât đinh, cac yêu tố ̣ ́ ́ ́
pu đo lương m c đô quan tâm cua ng̀ ứ ̣ ̉ ười dung đo v i cac san phâm vê cac yêú ́ ớ ́ ̉ ̉ ̀ ́ ́ tô tich c c hay tiêu c c t́ ́ ự ự ương ng. Tich vector san phâm va vector ngứ ́ ̉ ̉ ̀ ươi dung̀ ̀
Ti u i u
q p mô phong môi t̉ ́ ương tac gi a nǵ ữ ười dung ̀ u va san phâm ̀ ̉ ̉ i. Ta co ́ươc tinh́ ́ đanh gia cua u đôi v i san phâm I nh sau:́ ́ ̉ ́ ớ ̉ ̉ ư [8]
$ui T
u i
Hình 3.2. Ví d minh h a phụ ọ ương pháp th a s hóa ma tr n, ừ ố ậ x32 = (a,b,c)*(x,y,z)
V n đ thách th c chính là tính toán đ l p ánh x c a t ng s n ph mấ ề ứ ể ậ ạ ủ ừ ả ẩ và người dùng đ n các vector nhân t ế ố qi , f
u
p R . D a vào công th c (3.10)ự ứ ta có th d dàng ể ễ ước tính đánh giá c a m t ngủ ộ ười dùng cung c p cho b t kấ ấ ỳ m t s n ph m nào.ộ ả ẩ
Quá trình phân tích ma tr n s x y ra v n đ t n th t. Giá tr t n th t Lậ ẽ ả ấ ề ổ ấ ị ổ ấ được tính d a trên các s n ph m đã đự ả ẩ ược người dùng đánh giá, Giá tr trungị bình c a hàm t n th t càng nh thì tính hi u qu c a mô hình càng đủ ổ ấ ỏ ệ ả ủ ược đánh giá cao và ngượ ạc l i: [8]
2 2 2
( , )
( ui iT u) (|| || ||λ i || )u
u i K
L = r −q p + q + p
Trong đó K là t p ngậ ười dùng – s n ph m ả ẩ (u,i) mà ta đã bi t đánh giá ế rui. H ng s là m t s dằ ốλ ộ ố ương dùng đ làm m n sai s .ể ị ố
Phương pháp s d ng các đ c tr ng u tiên (Biased Matrixử ụ ặ ư ư Factorization )
M t l i ích c a cách ti p c n th a s hóa ma tr n trong l c c ng tác làộ ợ ủ ế ậ ừ ố ậ ọ ộ tính linh ho t c a nó trong vi c x lý các khía c nh d li u khác nhau và cácạ ủ ệ ử ạ ữ ệ yêu c u ng d ng c th khác nhau. Công th c (3.10) c g ng n m b t sầ ứ ụ ụ ể ứ ố ắ ắ ắ ự tương tác gi a các ngữ ười dùng và các s n ph m đ t o ra các giá tr đánh giáả ẩ ể ạ ị
khác nhau. Tuy nhiên, nhi u bi n th đề ế ể ược quan sát th y trong các giá tr x pấ ị ế h ng là do các hi u ng liên quan đ n ngạ ệ ứ ế ười dùng ho c s n ph m, đặ ả ẩ ược g iọ là các đ c tr ng u tiên (ặ ư ư biases ho c ặ intercepts), các đ c tr ng này không phặ ư ụ thu c vào b t c s tộ ấ ứ ự ương tác nào. Ví d : trong m t s h th ng l n, m t sụ ộ ố ệ ố ớ ộ ố người dùng có x p h ng cao h n nh ng ngế ạ ơ ữ ười khác và đ i v i m t s s nố ớ ộ ố ả ph m có xu hẩ ướng được x p h ng cao h n so v i nh ng s n ph m khác. Doế ạ ơ ớ ữ ả ẩ đó, có th th y m t s s n ph m để ấ ộ ố ả ẩ ược xem là t t h n (ho c t i t h n) m tố ơ ặ ồ ệ ơ ộ s s n ph m khác. Chính vì v y, ta có th xác đ nh thêm thành ph n đ cố ả ẩ ậ ể ị ầ ặ tr ng u tiên này vào đ c tr ng c a ngư ư ặ ư ủ ười dùng và đ c tr ng c a s n ph mặ ư ủ ả ẩ đ mô hình hóa. Mô hình hóa m t x p x đ c tr ng u tiên có th để ộ ấ ỉ ặ ư ư ể ược tính nh sau:ư
μ
ui i u
b = + +b b
Trong đó:
+ bui là thành ph n đ c tr ng u tiên c a ngầ ặ ư ư ủ ười dùng u và s n ph m ả ẩ i
+ µ là đánh giá trung bình t ng thổ ể
+ bu và bi l n lầ ượt là sai l ch tệ ương ng v i giá tr trung ứ ớ ị bình c a ngủ ười dùng u và s n ph m ả ẩ i
Ví d , gi s ụ ả ử ước tính b c nh t cho ngậ ấ ười dùng là đánh giá c a thuêủ bao X v d ch v MCA, đánh giá trung bình c a t t c các d ch v VAS ti nề ị ụ ủ ấ ả ị ụ ệ ích là 3,5 sao (µ =3,5). MCA được đánh giá t t h n so v i các d ch v trungố ơ ớ ị ụ bình, và nó có xu hướng được đánh giá trên m c trung bình là 0,2 sao. M tứ ặ khác, X là m t ngộ ười dùng đ c tr ng, có xu hặ ư ướng đánh giá th p h n so v iấ ơ ớ m c đánh giá trung bình là 0,1 sao. Nh v y, ứ ư ậ ước tính đánh giá cho d ch vị ụ MCA c a X là 3,6 sao (3,5+0,20,1).ủ
Áp d ng vào công th c (3.10) ta có công th c tính ụ ứ ứ ướ ược l ng đánh giá s d ng đ c tr ng u tiên nh sau:ử ụ ặ ư ư ư
μ Tui i u i u